te reo m \ = aori(称为m \ = aori),新西兰的土著语言在语言技术中的资源不足。 m \ = aori扬声器是双语的,其中m \ = aori用英语进行了代码开关。不幸的是,M \ = AORI语言技术,语言检测和M \ = Aori-English对之间的代码转换检测的资源最少。英语和M \ = AORI都使用罗马衍生的拼字法制作基于规则的系统来检测语言和代码转换限制性。大多数M \ = AORI语言检测是由语言专家手动完成的。这项研究构建了66,016,807个单词的Aori英语双语数据库,并带有单词级语言注释。新西兰议会汉萨德辩论报告用于构建数据库。语言标签是使用特定语言规则和专家手册注释分配的。 M \ = AORI和英语的单词具有相同的拼写,但含义不同。这些词不能根据单词级的语言规则将其归类为M \ = AORI或英语。因此,需要手动注释。还报道了报告数据库的各个方面的分析,例如元数据,逐年分析,经常出现的单词,句子长度和n-grams。这里开发的数据库是新西兰Aotearoa的未来语言和语音技术开发的宝贵工具。遵循标签数据库的方法也可以遵循其他低资源的语言对。
translated by 谷歌翻译
Estimating the probability of failure for complex real-world systems using high-fidelity computational models is often prohibitively expensive, especially when the probability is small. Exploiting low-fidelity models can make this process more feasible, but merging information from multiple low-fidelity and high-fidelity models poses several challenges. This paper presents a robust multi-fidelity surrogate modeling strategy in which the multi-fidelity surrogate is assembled using an active learning strategy using an on-the-fly model adequacy assessment set within a subset simulation framework for efficient reliability analysis. The multi-fidelity surrogate is assembled by first applying a Gaussian process correction to each low-fidelity model and assigning a model probability based on the model's local predictive accuracy and cost. Three strategies are proposed to fuse these individual surrogates into an overall surrogate model based on model averaging and deterministic/stochastic model selection. The strategies also dictate which model evaluations are necessary. No assumptions are made about the relationships between low-fidelity models, while the high-fidelity model is assumed to be the most accurate and most computationally expensive model. Through two analytical and two numerical case studies, including a case study evaluating the failure probability of Tristructural isotropic-coated (TRISO) nuclear fuels, the algorithm is shown to be highly accurate while drastically reducing the number of high-fidelity model calls (and hence computational cost).
translated by 谷歌翻译
尽管No-U-Turn采样器(螺母)是执行贝叶斯推断的广泛采用方法,但它需要许多后梯度,在实践中计算可能很昂贵。最近,人们对基于物理的动力学(或哈密顿)系统和哈密顿神经网络(HNNS)的机器学习引起了重大兴趣。但是,这些类型的体系结构尚未应用于有效地解决贝叶斯推论问题。我们建议使用HNN有效地进行贝叶斯推断,而无需大量的后梯度。我们向HNNS(L-HNN)引入潜在变量输出,以提高表达性和减少的集成误差。我们将L-HNN集成在坚果中,并进一步提出一种在线错误监控方案,以防止L-HNNS可能几乎没有培训数据的区域中采样堕落。考虑到几种复杂的高维后密度,并将其性能与螺母进行比较,我们证明了在线错误监测中的L-HNN。
translated by 谷歌翻译
语言随着时间的流逝而演变,单词含义会发生相应的变化。在社交媒体中尤其如此,因为它的动态性质会导致语义转移的速度更快,这使得NLP模型在处理新内容和趋势方面具有挑战性。但是,专门解决这些社交平台动态性质的数据集和模型的数量很少。为了弥合这一差距,我们提出了Tempowic,这是一种新的基准,尤其是旨在加快基于社交媒体的含义转变的研究。我们的结果表明,即使对于最近发行的专门从事社交媒体的语言模型,Tempowic是一个具有挑战性的基准。
translated by 谷歌翻译
随着COVID-19现在普遍存在,对高危个体的识别至关重要。利用来自宾夕法尼亚州西南部主要医疗保健提供者的数据,我们开发了预测严重Covid-19进展的生存模型。在这项工作中,我们在依赖许多功能的更准确模型和依赖一些与临床医生直觉相一致的功能的模型之间面临一个权衡。使事情变得复杂,许多EHR功能往往较低,从而降低了较小模型的准确性。在这项研究中,我们开发了两组高性能风险评分:(i)由所有可用功能构建的无约束模型;(ii)在训练风险预测因子之前,在培训风险预测因子之前就学习一小部分临床概念的管道。学到的概念提高了相应特征(C-Index 0.858 vs. 0.844)的性能,并在评估样本外(随后的时间段)时证明了(i)的改进。我们的模型表现优于先前的工作(C-Index 0.844-0.872 vs. 0.598-0.810)。
translated by 谷歌翻译
开放访问(OA)有助于访问文章。但是,作者或资助者通常必须支付出版费用,以防止没有参加OA出版和参与OA文章的引文优势的作者。 OA可能会加剧出版系统中现有的不平等现象,而不是克服它们。为了调查这一点,我们研究了Springer Nature发表的522,664篇文章。采用统计方法,我们描述了与来自不同收入水平的国家 /地区的作者之间的关系,其出版选择(OA或封闭式访问)以及论文的引用影响。一种机器学习分类方法帮助我们探索了作者的OA出版与属性之间的关联,尤其是有资格获得APC Waivers或折扣,期刊,国家和论文。结果表明,与其他作者相比,有资格获得APC-Waivers的作者在Gold-Oa-Journals上发布更多。相比之下,有资格获得APC折扣的作者的OA出版物比率最低,从而假设这种折扣不足以激发作者在Gold-Oa-Journal中发布。期刊的排名是在金色杂志上发布的重要驱动力,而OA选项大多是在混合期刊中避免的。资历,OA出版物的经验以及科学领域是OA出版物中最具决定性的因素。
translated by 谷歌翻译
当采样贝叶斯推断时,一种流行的方法是使用汉密尔顿蒙特卡洛(HMC),特别是No-U-Turn采样器(NUTS),该采样器(NUTS)自动决定汉密尔顿轨迹的结束时间。但是,HMC和螺母可能需要众多目标密度的数值梯度,并且在实践中可能会缓慢。我们建议使用HMC和坚果解决贝叶斯推理问题的汉密尔顿神经网络(HNNS)。一旦训练,HNN不需要在采样过程中的目标密度的数值梯度。此外,它们满足了重要的特性,例如完美的时间可逆性和哈密顿保护性,使其非常适合在HMC和坚果中使用,因为可以显示平稳性。我们还提出了一个称为潜在HNN(L-HNN)的HNN扩展,该扩展能够预测潜在的可变输出。与HNN相比,L-HNN提供了提高表达性和减少的集成误差。最后,我们在具有在线错误监测方案的螺母中使用L-HNN,以防止低概率密度区域的样本退化。我们证明了在螺母中的L-HNN,并在线错误监视了一些涉及复杂,重尾和高本地狂热概率密度的示例。总体而言,具有在线错误监控的坚果中的L-HNN令人满意地推断了这些概率密度。与传统的螺母相比,在线错误监控的螺母中,L-HNN需要1--2个目标密度的数值梯度,并通过数量级提高了每个梯度的有效样本量(ESS)。
translated by 谷歌翻译
叙事中的事件可以通过其参与者的基本状态理解为一致的整体。通常,这些参与者在叙述中没有明确提及,而是通过常识性或推论填写。理解叙述的模型应该能够推断出这些隐性参与者状态,以及有关这些状态对叙事的影响的原因。为了促进这一目标,我们介绍了一个新的众包参与者指出的数据集意大利面。该数据集包含有效的,可推断的参与者状态;对国家的反事实扰动;如果反事实是真实的,那么故事的变化将是必要的。我们介绍了三项基于州的推理任务,这些任务测试了一个故事何时由故事启用,修改一个反事实状态的故事,并解释给定经过修订的故事的最有可能的状态变化。我们的基准测试实验表明,尽管当今的LLM能够在某种程度上推理有关州的推理,但仍有很大的改进空间,这表明了未来研究的潜在途径。
translated by 谷歌翻译
我们旨在通过考虑网络钓鱼,脆弱性发现以及修补和剥削之间的动态来证明数学模型对网络安全技术进步的政策辩论的价值。然后,我们将输入调整为那些数学模型,以匹配其基础技术的一些可能进步。我们发现AI对网络钓鱼的影响可能被高估,但可能导致更多攻击未被发现。脆弱性发现的进步有可能帮助攻击者比防守者更多。与编写补丁程序的自动化相比,编写利用的自动化对攻击者更有用,尽管有助于更快地部署补丁的进步具有比任何一个更具影响力的潜力。
translated by 谷歌翻译
本文介绍并验证了一种新型的肺结节分类算法,该算法使用X射线图像中发现的多重分子特征。提出的方法包括一个预处理步骤,其中应用了两种增强技术:直方图均衡和小波分解和形态操作的组合。作为一种新颖性,使用基于小波领导者的形式主义的多型特征与支持向量机分类器一起使用。还包括其他经典纹理功能。当使用多重分子特征与经典纹理特征结合使用时,获得了最佳结果,最大ROC AUC为75 \%。结果显示使用数据增强技术和参数优化时的改进。在类似的实验设置中比较时,所提出的方法在计算成本和准确性中,比模量最大小波形式性更加有效,更准确。
translated by 谷歌翻译